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Алгоритм распознавания, 
основанный на нечетком подходе 


Рассматривается задача распознавания образов при условии линейной неразделимости классов на примере 
тестовой задачи, связанной с классификацией образцов топлива. Предложен алгоритм решения задачи, 
основанный на нечетком подходе. Описан подход к построению терм-множеств, основанный на анализе 
частоты встречаемости значений. Приведена оценка результатов работы алгоритма для тестовой задачи. 


Задачи распознавания образов в различных своих аспектах в настоящее время 
встречаются практически во всех сферах человеческой деятельности. Часто такие задачи 
возникают при создании систем поддержки принятия решений, позволяющих усо- 
вершенствовать и ускорить работу эксперта. 

Природа исходных данных в некоторых задачах допускает ситуацию, когда образ 
может принадлежать к нескольким классам по своим физическим параметрам, т.е. 
множества значений классов пересекаются, и отсутствует практическая их разделимость 
(даже при наличии генеральной выборки обучающего множества). На практике же 
такую неразделимость усугубляют неполные обучающие выборки. Задачи такого типа 
рассматриваются в статье. В них нечеткость присутствует по своей природе и априорная 
вероятность принадлежности образа определенному классу отсутствует, а есть предва- 
рительная выборка, обработка которой приводит к нечетким моделям образов. 

Нечеткие модели в теории распознавания становятся в последние годы одним из 
традиционных направлений. В частности, в некоторых задачах распознавания исполь- 
зуются нечеткие модели и нечеткий вывод [1]. В работах профессора Ротштейна и его 
учеников [2], [3] говорится об идентификации нелинейных объектов нечеткими базами 
знаний и использовании нечетких моделей в задачах распознавания. Интересным явля- 
ется использование нечетких чисел на выходе алгоритма (исключается этап дефаззи- 
фикации). 

Авторами были изучены существующие алгоритмы распознавания образов, 
и для задач описанной выше специфики был предложен свой алгоритм, который иллю- 
стрируется на примере задачи классификации образца топлива. В работе описан естес- 
твенный вариант модели, состоящий из набора нечетких множеств, соответствующих 
каждому классу образов. 

Целью работы является рассмотрение задачи распознавания при наличии разно- 
родных признаков с учетом нечеткости, связанной с измерением соответствующих 
параметров и оценкой принадлежности получаемых значений образам, принадлежащим 
различным классам. 


Постановка задачи и подходы к ее решению 


Рассматривается задача распознавания в традиционной постановке. Под образом 
понимаем п-мерный вектор х = (х,...,х,) е №". Задано множество классов образов Г = {11 


1=1,.. „ри обучающая выборка М как множество пар М={(х®, у? | хФ ЕЁ", у Е =Ь,... 8. 
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Рассматривается традиционная задача построения на основе обучающей выборки решаю- 
щего правила, которое позволило бы по предъявленному образу хе №” указать 
класс уЕЙ. При этом возможна неопределенность указания класса, степень которой 
необходимо оценить. Соответствующую оценку предполагается давать на основе 
методов нечеткой логики. 

В данной работе задача распознавания образов рассматривается на примере 
следующей практической задачи. 

Существует множество видов топлива, которые производят на различных заво- 
дах. При получении образца топлива в лаборатории необходимо быстро определить 
его марку и производителя. Таким образом, формируется совокупность классов 
образов. Информация о каждом образце формально представлена набором показа- 
телей, измеренных различными приборами, определяющими состав предъявленного 
образца, т.е. формируются образы в виде векторов, компонентами которых высту- 
пают значения измеряемых показателей. Результаты измерений, проведенных в раз- 
личные моменты времени и для различных образцов, являются исходной информацией 
для обучающей выборки. 

Существует множество подходов к решению задачи распознавания образов от 
традиционных методов распознавания до систем нечеткого вывода [4-7]. 

Каждый из существующих методов зарекомендовал себя в рамках решения 
определенных содержательных задач. Отметим следующие особенности рассматри- 
ваемой задачи. 

В рассматриваемом случае существенными аргументами для выбора нечеткого 
подхода являются следующие: во-первых, данные обладают содержательной неточ- 
ностью. Например, для тестовой задачи, различные образцы по набору показателей 
могут иметь близкие значения для различных производителей, что в ряде случаев не 
позволяет однозначно определить производителя. Во-вторых, стоимость некоторых 
измерений весьма высока, и не всегда возможно получить весь набор необходимых 
параметров для каждого образца, что при работе с обучающей выборкой не всегда 
дает возможность однозначного разбиения на классы, а при распознавании ведет 
к неоднозначности. Кроме того, возможна динамика изменения показателей по каж- 
дому производителю во времени. И, наконец, для пользователя (эксперта) важным 
является содержательное обоснование полученной классификации и возможность 
оценить степень соответствия образа каждому из зафиксированных классов. Авторам 
представляется, что учет указанных особенностей достаточно адекватно может быть 
осуществлен на основе использования понятий и методов нечеткой логики и нечет- 
ких множеств. 

Сформулируем основные моменты предлагаемого подхода. 

1. Вначале осуществляется построение моделей классов образов («портреты» 
класса). Для каждого класса такой «портрет» есть совокупность функций, взаимно- 
однозначно соответствующих отдельным показателям и описывающих степень 
уверенности в соответствии значения показателя выбранному классу образов. Эта 
совокупность функций строится по элементам выборки, принадлежащим опреде- 
ленному классу. 

Первичной характеристикой интегральной уверенности в принадлежности анали- 
зируемого образа класса является сумма соответствующих функций. 

Отметим, что при формировании указанных функций осуществляется пред- 
варительная обработка данных с целью уменьшения их зашумленности. 
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2. На основе моделей классов и первичных характеристик интегральной увереннос- 
ти вычисляются степени уверенности принадлежности предъявленного образа заданным 
классам. 

При рассмотрении задачи исходим из того, что множество информативных 
признаков выбрано с помощью эксперта, поэтому подзадача их выделения не рас- 
сматривается. 


Создание моделей классов 


Основная идея подхода состоит в следующем. Для каждого класса образов 
формируется совокупность проекций нечетких «портретов». Каждая такая инте- 
гральная проекция образуется на основании измеряемой информативной характеристики 
элементов выборки, входящих в данный класс. 

Первичная обработка данных необходима для удаления из обучающей выборки 
заведомо неточных ошибочных данных — выбросов, которыми в практической дея- 
тельности оказываются «засорены» экспериментальные данные. Для рассматри- 
ваемого типа задачи встречаются выбросы двух типов. Источник выбросов первого 
типа — человеческий фактор, приводящий к занесению заведомо некорректных значений 
в сводный журнал. Второй тип выбросов связан с технологической зашумленностью 
образцов, например, в ситуации, когда измерялись данные образца с примесями. Опре- 
делить выбросы в такой ситуации можно с помощью эксперта либо на основании 
статистических методов поиска выбросов [8]. 


В исходной задаче каждая компонента вектора хе А” определяет значение 
одного из п информативных признаков для данного образца. 

В соответствии с выделенными информативными признаками для каждого 
из них строится лингвистическая переменная Г, [9] на универсальном множестве из 
множества допустимых значений данного признака. Каждый терм и этой лингви- 


стической переменной является нечеткой характеристикой данного признака для опре- 
деленного класса образов. 

Подзадача построения функций принадлежности терм — множеств лингвисти- 
ческой переменной может быть решена несколькими методами. Функция принадлеж- 
ности может носить субъективный характер или интерпретироваться на основе понятия 
вероятности [10]. 

В данной задаче функции принадлежности каждого терма строятся по алгоритму, 
в основу которого положена частотная характеристика встречаемости значений приз- 
нака в обучающей выборке для данного класса образов. 


Алгоритм формирования функций принадлежности 


Как уже говорилось выше, в основу построения функции принадлежности положена 
частотная характеристика встречаемости значений признака. Универсальным множест- 
вом каждой лингвистической переменной является объединение носителей нечетких 
множеств термов — множество всех допустимых значений признака. На этапе построения 
отсеиваются резко выделяющиеся значения — выбросы. 


Значением функции принадлежности ,(х,) е [01] является степень уверенности, 


с которой образец х’ со значением 1-ой компоненты, равным х, ‚ соответствует }-ому клас- 
су образов. 
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Таблица 1 — Оценка степеней уверенности соответствия предложенного образа 


И Признак Г, | Признак Г, те Признак Г, Я 
1=1 
Класс у, и 1 У У @ (м, ) 
Класс у, и) и’, и и, @ (м) 
И; и и, \; @(м’,) 
Класс У, \, \ У», Ур @(у,) 


Функции строятся методом скользящего окна. Размер скользящего окна подби- 
рается экспериментально. 

На рис. | приведен пример терм-множества лингвистической переменной при- 
знака «Суммарная ароматика» для ситуации, когда количество классов образов п = 6. 


19.50 38,38 0,35 


Рисунок 1 — Терм-множество лингвистической переменной 
«Суммарная ароматика» 


Из рисунка видно, что функции принадлежности термов часто очень близки 
или пересекаются, что не дает возможности сделать вывод по данным только одного 
признака, поэтому необходима интегральная оценка по совокупности признаков. 


Вывод о принадлежности образа классу 


Чтобы получить значение степени уверенности соответствия предложенного 
образа каждому из классов образов у,, строится таблица И’ оценки степени уве- 
ренности. 


Й' = {(\ м, М, М, @(,)), 1 =1...В} , 
М = и; (х,), @(»,) — я 
1=1 


где и,(х) — функция принадлежности }-ого терма 1-ой лингвистической переменной, 


(у) — интегральная уверенность, а х, — 1-ая компонента распознаваемого образа х. 
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Ранжируем таблицу по последнему столбцу интегральных уверенностей и 
получаем класс у,, для которого ©(у) максимально. Он и определяется как наиболее 


соответствующий предложенному образу х. 

Эксперт по таблице Й’ определяет класс образов, которому наиболее соответ- 
ствует распознаваемый образец. В некоторых ситуациях оказывается, что с не намного 
меньшей степенью уверенности алгоритм относит этот образец и к другим классам 
образов. Такая ситуация объясняется излагавшимися выше факторами: классы не 
всегда линейно разделимы. Процент правильных ответов зависит от полноты обу- 
чающей выборки и количества используемых для распознавания информативных 
признаков. 


Тестовый пример 


Для тестовой задачи о распознавании марки и типа топлива был проведен ряд 
экспериментов. Была написана программа, работающая с базой данных и реализую- 
щая описанный алгоритм. 

Тестирование проводилось на обучающей выборке, состоящей из двух с поло- 
виной тысяч образцов, соответствующих 7 классам образов. В 91,5 % случаев пред- 
ложенный образ был распознан правильно. В 8,8 % случаев правильный класс образов 
оказывался в ранжированной таблице Й/” на 2 или 3 позиции. 

При тестировании программы был использован неполный набор инфор- 
мативных признаков (в базу не попала информация по некоторым характеристикам, 
что, по мнению авторов, стало причиной уменьшения количества точных решений). 

Анализ показал, что правильный результат в 99 % случаев попадает в первую 


тройку. 


Дообучение алгоритма 


Использованный способ принятия решения по максимуму интегральной 
характеристики можно понимать как построение разделяющей функции 


ан (>) ва а” (х,)— ибо (х,))‚ отличающей образы К-ого класса от образов 1-того 


1 


(0 1. о = 
класса при @,;’ =1: если значения всех функций 4, (х)> 0 при фиксированном К, то 


х относится к К-ому классу. Можно осуществить дообучение соответствующего 


алгоритма, подобрав соответствующим образом коэффициенты в" . Для этого можно 
использовать, например, алгоритм обучения персептрона при условии линейной 
разделимости модифицированных образов. Для обучения по этому алгоритму 
выборка разбивается на обучающую и контрольную. На контрольной выборке 


тестируется полученный алгоритм. 


Заключение 


Предложенный подход и реализованный на его основе алгоритм показали 
приемлемое качество результатов даже в варианте отсутствия прямого обучения. 
Качество распознавания может быть улучшено за счет указанного варианта до- 
обучения, хотя это и усложняет алгоритм. Нелинейность строящихся функций принад- 


598 «Искусственный интеллект» 472008 


Алгоритм распознавания, основанный на нечетком подходе 


ТК 


лежности в общем случае усиливает различающую способность алгоритма. Допол- 
нительно нечеткость измеряемых значений показателей может быть учтена при 
интерпретации их как нечетких чисел. Это позволит повысить качество принятия 
решения при классификации в случаях достаточно высокой степени неопреде- 
ленности. 
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В.А. Козловський, О.Ю. Максимова 

Алгоритм розшзнавання, заснований на нечёткому шдход! 

Розглядаеться задача розшзнавання образ1в за умови линно! нероздльност! класв на приклад! 
тестово! задач1, пов’язано! з класификащею зразкв палива. Запропоновано алгоритм ритення задач, 
заснований на нешткому шдход!. Описано шджд до побудови терм-множин, заснований на анал131 
частоти зустраваност! значень. Наведена ощнка результатв роботи алгоритму для тестово! задач. 


Статья поступила в редакцию 29.07.2008. 
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